重複上章節對「好奇心」的心理假設:
在展開細節前,先澄清一下,這裡指的「錯誤」是指「大腦中流動的內在訊號」,而不是一定要在真實世界慘遭失敗。
著名的「狗聽到鈴聲會流口水」的制約實驗,把這個實驗背後的機制講清楚一點:
簡言之,大腦用感官輸入時來預測後面刺激(食物)出現的機率。
延伸的意義是:
這些心理機制被運用在人工神經網路裡,在幾乎所有的 AI 學習監督系統中都有應用,也就是「對反應給予清楚明顯的回饋」。
在類神經網路中,學習就是降低不可預料性。大腦用 Input 來做預測,再根據驚訝、不可能性和錯誤程度來調整預測。
在上述理論浮現之前,有很長一段時間,大家認為大腦的學習是聯結式的,學習是建立 A 和 B 的聯結,因此從 A 可以想到 B。
這些略過作者的陳述,總之,已有清楚的實驗證明,學習和 association 無關,和驚訝有關。
會的,例如我們問一個你完全不知道的題目。畢卡索的 last name 是 Diego 還是 Rodrigo。
假設你猜 Diego,這時候你自信心很低。也就是你不確定。
而得到答案後,發現你竟然猜對了!此時的回饋還是會提供你的訊息!
你在亂猜時,答對機率是 50%;後來你才知道原來是 100%,這之間仍然有 50%的缺口。因此,你的大腦仍然會將訊號散播出去,並更新你的知識。
大腦的所有區域可以送出且交換錯誤訊號。例如用音符 & 旋律的例子,
不過,如果改成 CCC 組合:
→ 只有得到「驚訝、出乎意料」的訊息時,才會被轉呈到高層次的皮質。
大腦的每個區域都有這種發射錯誤訊號的機制。
當你建立一個預測,「期待某件事發生」時,你的報酬迴路/多巴胺迴路產生了反應。
接下來,多巴胺迴路開始預測「會不會有錯誤」?如果你「預測自己會獲得報酬」,多巴胺也會起反應。
意思是:自己批判自己,也會有學習效果,不必等到外在世界給你回饋。
這是為什麼 AI 應用中,要解決複雜問題時,普遍會用第一個神經網路去批判另一個神經網路。
我們不處罰 AI,我們只是告訴他哪裡錯了,並且放上標記。
後設分析清楚指出,回饋品質是決定成功的因素之一。
設立清楚的學習目標,並且讓學生慢慢達成。
有一個討論是「告訴學生『應該要怎麼做』,是不是討論告訴他們『做錯了』」
對於邏輯完美的人,上述狀況才會成立,邏輯完美人會知道在 A 選 B 的題目中,兩者的機率是 50%
但對孩子來說,對二選一的題目,他們不會明顯推論「選擇我選 A ,老師說我錯了,那麼正確答案就是 B」,但他們很容易就可以接收到「我做錯了」的訊息。
總之,對成人來說,報酬和處罰,兩者的訊息反應是等量的。而對青少年來說,因為青春期費洛蒙的影響,他們對報酬的期待遠大於錯誤。因此,對青少年溝通時,絕對不能混淆 error feedback 和處罰,一定要給予中性的回饋。
「打分數」最大的問題,是因為他不明確,分數是一堆不同錯誤的總和,所以他的訊息度不明確,無法成功引發 error feedback 反應。
分數要伴隨詳細的評估,才會有效。
電玩設計中,當難度提高時,永遠會有「重新挑戰」的機制,但學校的體驗中,老師通常不會讓學生重新考試,而是在下一週追加新的習題。這種設計造成了災難。
在「壞成績造成大腦情緒系統巨大傷害」的相關研究中,數學焦慮已經被大量測量,我們清楚看到痛苦和恐懼的神經迴路被活化了,和大腦深處的杏仁核建立連結,產生情緒海嘯,摧毀計算、短期記憶和學習的能力。
從老鼠的實驗中,我們更看到突觸凍結,形成僵硬的神經網路。
以上神經機制,對應到心理學說的 fixed mindset。反之則是 growth mindset.
要培養 growth mindset,在回饋時要避免指出「什麼是好」,需要建構獎勵的是
「考試」非常有效,前提是成功引發 error feedback 機制,不要引發處罰和莫名其妙的分數。
active engagement + error feedback,兩者混搭,效果最好。
花太多時間寫筆記、讀課本,但一直遲遲不測驗,效果會和「有做測驗」的組別差很多。
把訓練過程間隔開來,比一次集中的效果好 3 倍以上。
集中一次學習,會在重複中減低大腦活動。但分成很多天來學,則可以保持新奇感,也就是大腦的活化程度。
關於理想的間隔,一種說法是「睡一覺以後」,
但比較仔細的心理研究認為,最佳間隔要看「你想要保留記憶多久」。例如想要記憶 10 個月,那每 2 個月拿出來溫習,效果最持久。
也就是 20% 長度間隔。
在有長期間隔後,重複溫習同一份資料,我們說服大腦「這份資料很重要,將來會用到」,此時,記憶的機制,會把記憶投射到未來。
上述研究很容易落實在課堂中。理論上,「從頭到尾溫習」的效果比較好,所以期末考優於月考,但在實踐上,期末考比較容易引發「臨時抱佛腳」,而不是「每天間隔溫習」,這是理想與現實的落差。
一直重複同樣的東西,會學得更多嗎?→ 會,只要不確定性存在,就會產生學習。除非已經 100% 精通。不停重複才會形成固化(consolidation),此時才會真正讓資訊進入潛意識,讓心智自動化。